时间序列数据的积累和标签的不存在使时间序列异常检测(AD)是自我监督的深度学习任务。基于单拟合的方法只能触及整个正态性的某些方面,不足以检测各种异常。其中,AD采用的对比度学习方法总是选择正常的负面对,这是反对AD任务的目的。现有的基于多促进的方法通常是两阶段的,首先应用了训练过程,其目标可能与AD不同,因此性能受到预训练的表示的限制。本文提出了一种深层对比的单级异常检测方法(COCA),该方法结合了对比度学习和一级分类的正态性假设。关键思想是将表示和重建表示形式视为无阴性对比度学习的积极对,我们将其命名为序列对比。然后,我们应用了由不变性和方差项组成的对比度损失函数,前者同时优化了这两个假设的损失,后者则防止了超晶体崩溃。在四个现实世界中的时间序列数据集上进行的广泛实验表明,所提出的方法的卓越性能达到了最新。该代码可在https://github.com/ruiking04/coca上公开获得。
translated by 谷歌翻译
阶级不平衡问题很重要且具有挑战性。合奏方法由于其有效性而广泛用于解决此问题。但是,现有的合奏方法始终应用于原始样本中,而没有考虑原始样本之间的结构信息。限制将阻止不平衡的学习变得更好。此外,研究表明,样本中的结构信息包括本地和全球结构信息。基于上面的分析,此处提出了具有深层样本前网络(DSEN)(DSEN)和局部全球结构一致性机制(LGSCM)的不平衡合奏算法,以解决该问题。该算法可以保证高质量的深层信封样品用于用于考虑到本地流形和全球结构信息,这有助于失衡学习。首先,深层样品包络预网(DSEN)旨在挖掘样品之间的结构信息。样品。接下来,将DSEN和LGSCM放在一起以形成最终的深层样品网络网络(DSEN-LG)。之后,分别将基本分类器应用于深样品的层。最后,通过装袋集合学习机制融合了基本分类器的预测结果。为了证明该方法的有效性,选择了四十四个公共数据集和十多种代表性相关算法进行验证。实验结果表明,该算法明显优于其他不平衡的集合算法。
translated by 谷歌翻译
帕金森病(PD)的语音识别是其诊断的有效途径,近年来已成为一个炎热和困难的研究区。众所周知,一个主题中有大型语料库(段)。但是,太大的段会增加分类模型的复杂性。此外,临床医生有兴趣找到反映整个主题病理的诊断语音标记。由于每个语音样本段的最佳相关特征是不同的,因此难以找到均匀的诊断标记。因此,有必要将一个受试者内的现有的大段重构为几个段中的几个段,其可以促进相关语音特征的提取,以表征整个主题的诊断标记。为了解决这个问题,本文提出了一种基于多层模糊C均值(MLFCM)聚类和层间一致性保存的帕金森科目的封闭深音样本学习算法。该算法可用于实现帕金森病(PD)的对象内部样品重建,以获得少量的高质量原型样品段。在纸张结束时,分别选择了几个代表性的PD语音数据集,并将其与最先进的相关方法进行比较。实验结果表明,该算法有效地意识到。
translated by 谷歌翻译
由于机器学习和数据挖掘领域的不平衡数据集的分类问题,但学习的不平衡学习是重要的并且具有挑战性。提出采样方法来解决这个问题,而基于群集的过采样方法表现出很大的潜力,因为它们的目标是同时解决课堂和级别的不平衡问题。但是,所有现有的聚类方法都基于一次性方法。由于缺乏先验知识,通常存在的群集数量不当设置,这导致集群性能不佳。此外,现有方法可能会产生嘈杂的情况。为了解决这些问题,本文提出了一种基于模糊C-MATION(MLFCM)的基于深度外观信封网络的不平衡学习算法,以及基于最大均值(MINMD)的最小中间层间差异机制。在没有先前知识的情况下,该算法可以使用深度实例包络网络来保证高质量的平衡实例。在实验部分中,三十三个流行的公共数据集用于验证,并且超过十个代表性算法用于比较。实验结果表明,该方法显着优于其他流行的方法。
translated by 谷歌翻译
预测动态场景中的行人轨迹仍然是各种应用中的关键问题,例如自主驾驶和社会意识的机器人。由于人类和人类对象的相互作用和人类随机性引起的未来不确定性,这种预测是挑战。基于生成式模型的方法通过采样潜在变量来处理未来的不确定性。然而,很少有研究探索了潜在变量的产生。在这项工作中,我们提出了具有伪Oracle(TPPO)的轨迹预测器,这是一种基于模型的基于模型的轨迹预测因子。第一个伪甲骨文是行人的移动方向,第二个是从地面真理轨迹估计的潜在变量。社会注意力模块用于基于行人移动方向与未来轨迹之间的相关性聚集邻居的交互。这种相关性受到行人的未来轨迹往往受到前方行人的影响。提出了一种潜在的变量预测器来估计观察和地面轨迹的潜在可变分布。此外,在训练期间,这两个分布之间的间隙最小化。因此,潜在的变量预测器可以估计观察到的轨迹的潜变量,以近似从地面真理轨迹估计。我们将TPPO与在几个公共数据集上的相关方法进行比较。结果表明,TPPO优于最先进的方法,具有低平均和最终位移误差。作为测试期间的采样时间下降,消融研究表明预测性能不会显着降低。
translated by 谷歌翻译
插入整孔组件是一项艰巨的任务。由于孔的公差很小,插入中的较小错误将导致故障。这些故障会损坏组件,并且需要手动干预才能恢复。错误可能来自不精确的对象抓取和弯曲销。因此,重要的是,系统必须准确地确定对象的位置并拒绝弯曲销的组件。通过利用对象中固有的约束,使用模板匹配的方法可以获得非常精确的姿势估计。还实施了针对销检查的方法,并显示了成功的方法。该设置是自动执行的,具有两个新颖的贡献。对引脚进行深度学习分割,并通过模拟发现检查姿势。从检查姿势和分段引脚中,然后生成用于姿势估计和引脚检查的模板。为了训练深度学习方法,创建了分段整个孔组件的数据集。该网络在测试集上显示97.3%的精度。还在插入CAD模型上测试了PIN分割网络,并成功地分割了引脚。完整的系统在三个不同的对象上进行了测试,并且实验表明该系统能够成功插入所有对象。通过手动纠正错误和用弯曲销的对象拒绝对象。
translated by 谷歌翻译
在我们生活在深厚的互连世界中,我们周围的各个信息链接域。由于图形数据库包含了数据之间有效的关系,并允许处理和查询这些连接,因此它们正迅速成为支持广泛域和应用程序的流行平台。与关系情况一样,可以预期数据保留了一组完整性约束,这些限制定义了它代表的世界的语义结构。当数据库不满足其完整性约束时,一种可能的方法是搜索确实满足约束(也称为维修)的“类似”数据库。在这项工作中,我们使用基于一组Reg-GXPath表达式作为完整性约束的一致性概念来研究图形数据库的计算子集和超集修复的问题。我们表明,对于Reg-GxPath的积极片段,这些问题承认了多项式时间算法,而语言的全部表达力使它们棘手。
translated by 谷歌翻译
自动柜员机(ATM)代表最常用的撤销现金系统。欧洲中央银行于2019年报告了110亿美元的现金提取和在欧洲ATM上装载/卸载交易。虽然ATM经历了各种技术演变,但个人识别号码(PIN)仍然是这些设备的最常见的认证方法。不幸的是,PIN机构容易通过安装在ATM附近的隐藏照相机进行的肩部冲浪攻击来捕获针脚垫。为了克服这个问题,人们习惯于另一方面覆盖打字。虽然这些用户可能相信这种行为足够安全,但无法防范提到的攻击,但对科学文献中的这种对策没有明确评估。本文提出了一种新的攻击,以重建被另一方面覆盖着键入的受害者进入的别针。我们考虑攻击者可以访问与目标相同品牌/型号的ATM引脚垫的设置。之后,攻击者使用该模型推断受害者在进入PIN的同时按下的数字。我们的攻击归功于精心选择的深度学习架构,可以从打字的手势和运动中推断出别针。我们运行详细的实验分析,包括58个用户。通过我们的方法,我们可以猜出三次尝试中的5位点引脚的30% - 在阻塞卡之前通常允许的那些。我们还对78名用户进行了一项调查,该调查设法达到了相同的设置平均仅为7.92%的准确性。最后,除非整个键盘被屏蔽,否则我们评估了被证明的屏蔽反应。
translated by 谷歌翻译
In this paper, we propose a robust 3D detector, named Cross Modal Transformer (CMT), for end-to-end 3D multi-modal detection. Without explicit view transformation, CMT takes the image and point clouds tokens as inputs and directly outputs accurate 3D bounding boxes. The spatial alignment of multi-modal tokens is performed implicitly, by encoding the 3D points into multi-modal features. The core design of CMT is quite simple while its performance is impressive. CMT obtains 73.0% NDS on nuScenes benchmark. Moreover, CMT has a strong robustness even if the LiDAR is missing. Code will be released at https://github.com/junjie18/CMT.
translated by 谷歌翻译
Knowledge graphs (KG) have served as the key component of various natural language processing applications. Commonsense knowledge graphs (CKG) are a special type of KG, where entities and relations are composed of free-form text. However, previous works in KG completion and CKG completion suffer from long-tail relations and newly-added relations which do not have many know triples for training. In light of this, few-shot KG completion (FKGC), which requires the strengths of graph representation learning and few-shot learning, has been proposed to challenge the problem of limited annotated data. In this paper, we comprehensively survey previous attempts on such tasks in the form of a series of methods and applications. Specifically, we first introduce FKGC challenges, commonly used KGs, and CKGs. Then we systematically categorize and summarize existing works in terms of the type of KGs and the methods. Finally, we present applications of FKGC models on prediction tasks in different areas and share our thoughts on future research directions of FKGC.
translated by 谷歌翻译